DOI: 10.3974/geodp.2017.04.21

地球观测组织(GEO)数据共享、数据管理解决方案及最佳案例研讨会总结

褚文博1Paul. F. Uhlir 2*

1. 国际地球观测组织秘书处,日内瓦 1211,瑞士;

2. Consultant on Information Policy and Management, 纽约 12723, 美国

 

地球观测组织(the Group on Earth ObservationsGEO)数据共享工作组、数据管理工作组和GEO秘书处于20171023日在美国华盛顿召开的GEO全会期间主办了GEO数据共享、数据管理与最佳案例研讨会。来自GEO成员国、GEO成员组织、GEO项目负责人等70余位专家、学者、政府代表出席了此次会议。

此次会议的主要目的是在GEO成员国、成员组织单位、GEO各项目组(旗舰项目、优先领域项目、基础设施建设项目)中进一步推动数据共享。正如GEO新十年规划阐述的那样:实施全球综合地球观测系统(Global Earth Observations System of Systems, GEOSS)的数据共享和数据管理原则是未来十年中GEO取得成功的关键。没有开放和管理良好的地球观测数据,GEO在各个领域的应用或决策取得成功将是不可能的。

会议集中在以下四个主题,每一个主题作为一个分会的集中论题,这四个主题分别是:

1.  数据开放共享与健全数据管理的重要性和前沿性问题;

2.  GEO项目实施过程中执行GEO数据共享和数据管理原则的经验和最佳案例;

3.  GEO成员国和成员组织执行GEO数据共享和数据管理原则的经验和最佳案例;

4.  GEOSS数据共享公共基础设施建设中执行GEO数据共享和数据管理原则的经验和最佳案例。

GEO秘书处Barbara Ryan主任,联合国全球地理空间信息管理专家委员会共同主席兼GEO中国国家代表、国家测绘局李朋德副局长分别出席了上午和下午的会议并致辞。Barbara Ryan主任对GEO数据共享和数据管理工作取得的成就表示赞赏,她指出,GEO支持联合国2030年可持续发展目标议程(UN 2030 Agenda for Sustainable Development Goals, SDGs)、巴黎气候变化协定(the Paris Agreement on Climate Change)和仙台减少灾害风险框架(the Sendai Framework for Disaster Risk Reduction)等国际议程,GEO数据共享和健全的数据管理是我们实现上述目标的必要保障。李朋德副局长分享了他在联合国和中国关于公开数据由此激发社会各种积极的影响方面的一些经验。他鼓励GEOUN-GGIM加强合作,进一步总结出好的经验和案例,并在GEOUN-GGIM中广泛推广。

第一个分会由国际科学理事会(International Council for Science, ICSU)代表、美国哥伦比亚大学国际地球科学信息网络中心主任Robert Chen博士主持。会议邀请了数据开放领域的非政府组织(Non-Governmental Organization, NGOs)领导人担任嘉宾,他们分别是:数据开放瞭望组织(Open Data Watch, http://opendatawatch. com/) 负责人Shaida Badiee博士,光亮地球组织(Radiant Earth, https://www.radiant.earth/)负责人Anne Hale Miglrese博士和可持续发展目标契约组织(SDG Compacts 2020)负责人Paul Zeitz博士。他们从更广泛的角度,而不仅仅限于地球观测数据,来审视数据共享和管理的价值、重要性和未来发展之路。

Shaida Badiee首先提出了地球观测数据与统计数据的开放与融合问题。他指出,当前关于开放数据的挑战不是“如果”,而是“已经到来和如何应对”。地球观测数据是全球数据生态系统的一部分。GEO应该与其他数据,如统计数据融合贯通。作为这种合作改革的中介,各国国家统计系统将发挥更大的作用,并与GEO数据更密切地结合在一起。在同一政府部门(如墨西哥)拥有官方统计数据和地球观测数据的国家,数据和政府部门都可能更受信任和受到高度重视。更进一步是在统计法中把地球观测数据列入其中。

Anne Hale Milagrese指出,按照标准的互操作规范进行共享数据是至关重要的。空间数据传输标准(Spatial Data Transfer Standards, SDTS)方面的创新长期以来是由政府投资主导的,但由于商业市场庞大,现在越来越多地由私营部门主导。由于新的应用,如自动驾驶汽车,市场正在大幅扩张。互操作性标准即使对于封闭数据也是必不可少的,因为开放和封闭数据需要协同工作。

Peter Zeitz强调,地球观测领域的管理人员和决策者需要考虑数据整合和数据应用的机制问题。各企事业科技活动和发展规划都需要有数据的支撑,有些单位力图使有数据支撑的规划成为强制性的,在这个过程中,推动数据共享和规范应用的速度会加快。在这种情况下,参与这些活动的相关人员应该考虑回报问题,尤其是费用方面的回报问题。他列举了数据驱动的艾滋病病毒/艾滋病项目(PEPFAR)和世界城市数据理事会(World Council On City Data)的例子,后者制定了国际标准(ISO),对城市的开放性进行了认证等举措就是采取这种有效的机制。

与会专家也讨论了数据共享的主要障碍问题,究竟这些障碍是主要来自技术性问题还是社会和政策性问题。嘉宾和与会专家通过案例分析一致认为,社会和政策障碍远远大于技术障碍。对于如何促进私营部门为公共利益进行数据共享,嘉宾列举了Uber与纽约市政府分享数据、Facebook与世界银行和经合组织(OECD)分享数据的案例,认为这些案例都是目前应该提倡的积极案例。当然,数据共享要特别关注隐私保护问题。数据共享、数据管理、数据应用的能力建设也是一个不可忽视的问题。

在以下三个议题报告和研讨中,重点集中在GEO计划实施过程中数据共享和数据管理的经验和最佳实施案例。

首先报告的是GEO旗帜项目和前沿领域项目执行过程中数据共享和数据管理的经验和最佳案例。会议由美国佐治亚理工大学Mariel Borowitz副教授主持。在GEO新十年发展计划中,确定了4项旗舰计划和22项前沿领域计划。在这次会议上,有三项被选为项目执行中数据共享和数据管理最佳案例项目。他们分别是GEO全球灾害监测项目、GEO全球湿地监测项目和全球冷寒区遥感监测项目。

Stefano Salvi博士代表GEO全球灾害监测项目组报告了项目的进展和数据共享、数据管理的经验。Jonas Eberle博士代表GEO湿地项目报告了该项目数据的研发与共享和管理经验。由于GEO寒冷地区项目负责人Peter Pulsifer未能出席会议,该项目数据管理和共享经验由邱玉宝博士报告。与会专家认为GEO数据及时开放、全球共享是全球灾害监测、减灾、防灾的最能发挥作用的地方;由全球湿地观测项目参加单位共同提供高质量数据和数据分析工具,是全球湿地保护和可持续湿地生态系统利用最重要的一步;建立全球寒区合作共享网对于全球寒区环境监测十分重要,也是该项目能够成功进行的经验所在。

对于GEO前沿领域项目产生的数据产品如何进一步推动广泛应用的问题,邱玉宝指出,尽管GEO提出了数据共享原则和管理原则框架,但原则过于笼统,在具体实施中难以贯彻执行。他建议GEO数据共享工作组采用案例方法很有效,并希望能够用一些幻灯片或其他方式展示案例可能对推动数据管理和数据共享效果更好一些。Jonas Eberle建议,用案例方法实证GEO数据共享和管理原则的实施非常重要,如果能够配上更详细的数据管理和数据共享计划效果会更好。Stefano Salvi认为,GEO旗舰项目和前沿领域项目产生的数据以及各个项目组之间在数据共享和管理方面的直接互动将非常有益于GEO新十年战略计划的实施。

下午的会议由国际科学和技术数据委员会 (the international Committee on Data for Science and Technology , CODATA) 代表Paul F. Uhlir博士担任主席,下午的第一个分会集中讨论了GEO成员和参与组织在数据管理政策和执行方面的经验和最佳实践。会议由Carrie Seltzer博士主持。

GEO由各国政府成员(Member)和参加的国际组织(Participate Organization)组成。目前GEO105个国家成员(包括欧盟委员会)和118个国际组织参加成员。在GEO成员分会上,来自美国、英国、中国和巴西的代表被选为最佳案例嘉宾介绍该国在地球观测数据管理和共享方面的经验。美国海洋和大气管理局的Jeff de la Beaujadiere博士、英国环境署的Chris Jarvis博士、中国国家遥感中心(中国科学院)的石瑞香博士(代替未能出席的刘闯博士);以及巴西国家空间研究所的Gilberto Camara博士分别代表这四个国家发言。

美国代表Jeff de la Beaujadiere博士介绍了美国国家海洋大气局(NOAA)数据政策https://nosc.noaa.gov/EDMC/、数据门户https://data.noaa.gov、数据访问支持https://coastwatch.pfeg.noaa.gov/erddap /index.html),包括在https://geo-ide.noaa.gov/统一访问框架以及数据集标识符项目。他指出,数据管理本身并不是目的;目的是使用和重复使用数据,并从数据中获取最大价值。Chris Jarvis博士报告了英国在实施“默认开放数据”的数据政策方面的一些经验。英国的实践经验证明,由于实施了“默认开放数据”的数据共享政策,地球观测数据(包括环境数据)的使用量增加了25倍,数据的应用价值提高了很多。石瑞香报告了“全球变化科学研究数据出版系统”(包括中英文双语版的“全球变化数据学报”)(http//www.geodoi.ac.cn)这一中国的新实践经验。这个创新举措为最终用户提供了开放的数据政策,为数据和引文提供了数字化标识符(DOI),为质量控制提供同行专家评审,并与传统期刊建立数据管理伙伴关系等。这项被誉为“中国科学数据共享新的里程碑”的成果和解决方案对于那些仍在公开数据政策中苦苦挣扎的发展中国家来说,虽然没有涉及政府数据开放的内容,但对政府资助产生的科学研究数据的管理和共享提供了新型机制,这个机制能够自下而上地调动科学家们在数据共享和数据管理上的积极性,成为GEO数据共享新型案例。Gilberto Camara博士介绍了巴西在开放数据方面的经验。例如通过开放卫星观测数据实时监测毁林和森林生态系统的工作都是在实践GEO数据开放共享原则基础上完成的。巴西的多维数据集成计划(Data Cube)正在实施中,该计划的实施将有助于数据的应用和高质量数据的集成管理。

研讨会的最后一个议题是国际地球观测组织(GEO)综合地球观测系统(GEOSS)基础设施建设问题。英国Miles Gabriel博士主持了这个议题的讨论。GEOSS基础设施建设项目负责人Siri Jodha Khalsa工程师全面介绍了GEOSS共同基础设施(GCI)的建设情况,包括GEOSS数据共享原则(DSPs)和数据管理原则(DMPs),GEOSS的黄页系统(http://www.geoportal.org/yellow-pages),数据保藏认证和状态检查,以及数据集评估和用户反馈系统等。目前,纳入到GEOSS系统中的数据集元数据记录超过180万个,这些数据集记录依据统一的元数据标准、由GEO认定的国家或组织提供的GEOSS数据贡献单位定期或不定期地提供元数据记录完成。来自电气和电子工程师协会(Institute of Electrical and Electronics Engineers, IEEE)的代表Siri Jodha KhalsaSteve Browdy、欧洲联盟委员会联合研究中心的代表Massimo Craglia、世界数据系统(WDS)的代表Robert Down担任该议题讨论的嘉宾。

Massimo Craglia介绍了对GEOSS系统中180万个元数据记录深入分析的结果,这些数据涵盖了89%GCI数据。尽管有520种描述“开放数据”的方法,在180万个数据中有140万个是通过GEOSS开放数据(Data-CORE)提供的。虽然目前GEOSS基础设施建设取得很大成绩,但也存在一些问题,例如,有些数据集没有持久标识符,给数据永久保藏和管理造成一定的困难,这个问题将在下一步的工作中加以改进。Robert Downs提出基于DSPs DMPs之间的协同作用和识别技术应该优先考虑实现数据共享与数据管理的效益,如何增加数据应用效益应该成为GEOSS数据基础设施设计和建设的出发点。Steven Browdy指出通过调查,特别应该注意的是数据间的互操作问题。语义互操作性是另一个需要在数据词汇表达之间进行更好的协调或映射的领域。

与会专家一致认为,GEO有必要继续更多地关注数据共享和数据管理原则的执行情况,特别是对已经启动的GEO新十年战略计划中实施项目中数据共享、管理和应用及再应用中的进展、对GEO各成员国和成员组织在数据资源开发的贡献、共享、管理的新经验、新进展的总结和推广、对GEO数据基础设施建设中的新成果和新挑战的及时总结非常重要。大家一致认为,GEO数据共享和数据管理是实现GEO新十年发展战略和实现联合国可持续发展目标的必要条件,是GEO可以做出特殊贡献的领域。GEO数据共享工作组和数据管理工作组将按照GEO新十年战略计划制定具体实施计划,把本次研讨会的共识和最佳案例经验及其解决方案及时总结,加以推广。

(详细信息请查看:http://www.earthobservations.org/geo14.php?seid=536